Reconnaissance automatique de la parole pour des langues peu dotées. (Automatic Speech Recognition for Under-Ressourced Languages)

نویسنده

  • Viet Bac Le
چکیده

We present here a methodology for fast development of ASR systems for new under-resourced languages. The resources collected for vietnamese, and the experimental results of our first vietnamese ASR system are presented. Our best system obtains 64% of word accuracy rate. The current validation of our methodology for khmer language is also described at the end of this paper.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

A State of the Art of Word Sense Induction: A Way Towards Word Sense Disambiguation for Under-Resourced Languages

______________________________________________________________________________________________ Word Sense Disambiguation (WSD), the process of automatically identifying the meaning of a polysemous word in a sentence, is a fundamental task in Natural Language Processing (NLP). Progress in this approach to WSD opens up many promising developments in the field of NLP and its applications. Indeed, ...

متن کامل

Building a Bilingual Vietnamese-French Named Entity Annotated Corpus through Cross-Linguistic Projection

Résumé. La création de ressources linguistiques de bonne qualité annotées en entités nommées est très coûteuse en temps et en main d’œuvre. La plupart des corpus standards sont disponibles pour l’anglais mais pas pour les langues peu dotées, comme le vietnamien. Pour les langues asiatiques, cette tâche reste très difficile. Le présent article concerne la création automatique de corpus annotés e...

متن کامل

Contribution à l'étude de la variabilité de la voix des personnes âgées en reconnaissance automatique de la parole (Contribution to the study of elderly people's voice variability in automatic speech recognition) [in French]

RÉSUMÉ L’utilisation de la reconnaissance vocale pour l’assistance à la vie autonome se heurte à la difficulté d’utilisation des systèmes de RAP qui ne sont pas prévus à la base pour la voix âgée. Pour caractériser les différences de comportement d’un système de reconnaissance entre les personnes âgées et non-âgées, nous avons étudié quels sont les phonèmes les moins bien reconnus en nous basan...

متن کامل

Issues in acoustic modeling of speech for automatic speech recognition

Stochastic modeling is a exible method for handling the large variability in speech for recognition applications. In contrast to dynamic time warping where heuris-tic training methods for estimating word templates are used, stochastic modeling allows a probabilistic and automatic training for estimating models. This paper deals with the improvement of stochastic techniques, especially for a bet...

متن کامل

Un système de segmentation automatique de gestes appliqué à la Langue des Signes (An automatic gesture segmentation system applied to Sign Language) [in French]

RÉSUMÉ De nombreuses études sont en cours afin de développer des méthodes de traitement automatique de langues des signes. Plusieurs approches nécessitent de grandes quantités de données segmentées pour l’apprentissage des systèmes de reconnaissance. Nos travaux s’occupent de la segmentation semi-automatique de gestes afin de permettre d’identifier le début et la fin d’un signe dans un énoncé e...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2006